Kaggle 大師教您用 Python 玩資料科學,比賽拿獎金

Kaggle 大師教您用 Python 玩資料科學,比賽拿獎金

作者: 石原祥太郎 村田秀樹 許郁文 譯
出版社: 碁峰資訊
出版在: 2021-04-12
ISBN-13: 9789865027681
ISBN-10: 9865027682
裝訂格式: 平裝
總頁數: 192 頁





內容描述


本書是利用Python參加機器學習競賽「kaggle」的入門書。一開始先以適合初學者學習的「Titanic:Machine Learning from Disater」競賽學習Kaggle的基礎。從中除了可學習實踐Titanic的方法,還能掌握自行參加競賽所需的知識。

本書具有以下特色:
.為了kaggle撰寫的習作教學書籍
.每一章或每一節都有具體的主題,可讓讀者按部就班地掌握需要的知識
.解說各種表單、圖片檔、文字檔的操作方法,作為進入下一個競賽的路標。
.兩位執筆者都擁有「Kaggle Master」的稱號,也有賺到獎金的經驗
.除了說明之外,還有兩位筆者的對談,從不同的角度介紹Kaggle的魅力
.會為程式設計與Python的初學者詳細講解範例程式


目錄大綱


第1章|了解Kaggle
1.1 何謂Kaggle
1.2 於Kaggle使用的機器學習
1.3 建立Kaggle的帳號
1.4 Competitions 頁面的概要
1.5 不需另行建置環境的「Notebooks」的使用方法

第2章|著手進行Titanic
2.1 先submit !試著寫進順位表
2.2 掌握全貌!了解submit之前的處理流程
2.3 找出下一步!試著進行探索式資料分析
2.4 在此拉開差距!基於假設建立新的特徵值
2.5 決策樹是最強的演算法?試著使用各種機器學習演算法
2.6 機器學習演算法的心情?試著調整超參數
2.7 在submit 之前!了解「Cross Validation」的重要性
2.8 「三個臭皮匠,勝過一個諸葛亮!」體驗集成學習

第3章|往Titanic的下個階段前進
3.1 操作多個表格
3.2 操作影像資料
3.3 操作文字資料

第4章|為了進一步學習
4.1 挑選競賽的方法
4.2 初學者適用的參賽方式
4.3 可選擇的分析環境
4.4 值得參考的資料、文獻、連結
4.5 第4 章總結

附錄A|範例程式碼詳細解說


作者介紹


石原祥太郎(u++)
.Kaggle Master(https://kaggle.com/sishihara)。
.2019年4月於「PetFinder.my Adoption Prediction」競賽獲得冠軍。
.2019年12月協助舉辦「Kaggle Days Tokyo」的競賽。
.於2019年3月在Qiita公開的Kaggle入門文章得到1600個讚。
.於日本經濟新聞社從事資料分析。

村田秀樹(咖哩)
.Kaggle Master(https://kaggle.com/currypurin)。
.2018年8月於「Santander Value Prediction Challenge」競賽得到solo gold medal(第8名)。
.2019年6月於「LANL Earthquake Prediction」競賽得到第三名。
.為了Kaggle初學者所寫的同人誌《Kaggle的習作》累計賣出2500本。
.從2018年7月開始成為專職Kaggler。




相關書籍

大數據分析:Python爬蟲、數據清洗和數據可視化

作者 黃源 蔣文豪 徐受蓉

2021-04-12

當電腦體系結構遇到深度學習:面向電腦體系結構設計師的深度學習概論

作者 [美] 布蘭登·里根(Brandon Reagen) 羅伯特·阿道夫(Robert Adolf) 保羅·沃特莫(Paul Whatmough) 古楊·魏(Gu-Yeon Wei) 大衛·布魯克斯(David Brooks)

2021-04-12

數據化決策 數據分析與高效經營

作者 [日]BSR 大數據科學研究會

2021-04-12